通过阿里云Prometheus监控监测Knative数据并在阿里云Grafana查看监控大盘

ACK集群已经兼容阿里云Prometheus和Grafana，无需您自建监控系统和可视化大盘。在Knative中部署业务应用后，您可以将Knative服务的监控数据接入Prometheus，通过Grafana大盘实时查看Knative的响应延迟、请求并发数、CPU和内存资源用量等数据。

前提条件

已在集群中部署Knative，请参见部署Knative。

将Knative服务的监控数据接入阿里云Prometheus监控功能后，相关组件会自动将监控指标发送至阿里云Prometheus服务，这些指标将被视为自定义指标。使用自定义指标会引起额外的费用。

为避免产生额外的费用，建议在启用此功能前，仔细阅读阿里云Prometheus的计费概述，了解自定义指标的收费策略。费用将根据您的集群规模和应用数量等因素产生变动。您可以通过资源消耗统计功能，监控和管理您的资源使用情况。

开启阿里云Prometheus监控后，即可在监控大盘页签下查看具体的监控数据。

分类	说明
请求数据	在Overview (average over the selected time range)区域，查看Knative的请求量（Request Volume）、请求成功率（Success Rate）、4xx（客户端错误）、5xx（服务器端错误）和Pod扩缩容趋势的监控数据。说明 Request Volume、4xx和5xx的大盘图标纵轴ops/sec表示每秒处理请求数。
响应延迟数据	在Response Time区域，查看Knative的响应延迟数据，包括P50、P90、P95和P99。
请求并发数	在Autoscaler区域，查看Knative的请求并发数的详细数据。
资源使用量情况	在Resource Usages区域，查看Knative的资源使用量情况，包括CPU和内存。

在ARMS控制台左侧导航栏，单击接入管理，在右侧页面的已接入环境的容器环境页签下，单击对应Prometheus服务实例的名称。在容器环境页面，单击指标采集，查看Knative服务发现指标。以下介绍Knative服务发现关键指标。

说明

当Knative应用缩容到0且没有Pod实例时，Prometheus无法采集Pod的并发请求数、每秒请求数等指标。只有访问Knative应用Pod后，控制台才会展示这些指标。
当Knative应用没有缩容到0时，无需访问Knative应用Pod，控制台便会展示Pod的并发请求数、Pod每秒请求数等指标。

指标名称	说明
queue_average_concurrent_requests	Pod的并发请求数。
queue_requests_per_second	Pod每秒请求数。
revision_request_latencies	响应延迟。
revision_request_count	Revision请求数。